SmolVLM e SmolVLM2: IA compacta que entende imagem e vídeo (e cabe no bolso!)
Vi um artigo interessante sobre SmolVLM e SmolVLM2, modelos compactos que entendem imagem e vídeo. Falo sobre por que modelos pequenos são importantes, como funcionam (pixel shuffle!) e a praticidade de rodar eles em hardware simples. Modelos eficientes para aplicações reais.